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摘 要 A= (third-party punishment, TPP) 指 个 体 作为 第 三 方 或 者 观察 者 为 维护 社会 
规范 对 违规 者 所 实施 的 惩罚 行为 。 大 量 研究 为 揭示 TPP 行为 的 神经 机 制 提供 了 启示 ， 但 鲜 
有 研究 关注 不 同 功 能 性 脑 网 络 在 其 中 发 挥 的 整体 作用 。 本 文 综述 了 近 十 年 来 TPP 相关 的 研 
究 ， 对 相关 理论 模型 和 脑 网 络 进行 总 结 ， 并 在 此 基础 上 提出 TPP 的 认 知 神经 网 络 模型 ， 系 
统 地 对 TPP 行为 背后 的 神经 机 制 进行 解释 和 整合 。 在 该 模型 中 , 情绪 系统 和 奖赏 系统 是 TPP 
的 动力 来 源 ， 认 知 系统 主要 负责 足 任 评估 以 及 惩 昼 的 选择 ， 奖赏 网 络 、 突 显 网 络 、 默 认 模 式 
网 络 和 中 央 执 行 网 络 分 别 参与 不 同 认 知 加 工 阶段 。 该 模型 建立 了 TPP 相关 研究 在 心理 层 
和 认 知 神经 层面 上 的 联系 ， 对 TPP 行为 的 发 生 和 发 展 机 制 进行 了 更 加 整体 、 全 面 的 解 
未 来 可 以 引入 元 分 析 或 基于 机 器 学 习 的 分 析 方 法 , 在 不 同 的 背景 信息 和 更 加 复杂 的 社交 情境 
下 探讨 第 三 方 干预 偏好 以 及 背后 的 认 知 神经 机 制 。 

关键 词 第 三 方 惩罚 ， 认 知 神经 机 制 ， 脑 网 络 ，fMRI 
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1 前 言 


社会 规范 的 建立 与 执行 是 人 类 区 别 于 其 他 动物 的 显著 特征 之 一 (Késter et al., 2022)， 但 
日 常生 活 中 违规 行为 仍然 普遍 存在 。 增 加 制度 约束 可 以 提高 人 们 遵守 规范 的 可 能 性 (Fehr & 
Schurtenberger, 2018)。 社 会 惩 昼 是 一 种 常见 的 道德 和 制度 约束 行为 (Fehr & Fischbacher, 
恶 、 以 
牙 还 牙 ” 的 第 二 方 惩 避 行为 , TPP 指 个 体 作 为 第 三 方 或 者 观察 者 为 维护 社会 规范 对 违规 者 所 
实施 的 惩罚 行为 (Fehr & Fischbacher, 2004a; Kanakogi et al., 2022)。 一 般 而 言 ， 这 种 惩罚 不 会 
给 个 体 带 来 直接 利益 , 且 需 要 付出 一 定 代 价 , 因此 常 被 看 作 一 种 利他 德 罚 (Fehr & Fischbacher, 
2003). TPP 约束 和 规范 了 人 类 行为 ， 进 一 步 维 系 并 促进 了 社会 公平 和 社会 合作 ， 因 而 受到 


2004b)， 分 为 第 二 方 惩 可 和 第 三 方 惩 避 (third-party punishment, TPP); PEF “Ah 


= 


Sr 


究 者 们 广泛 的 关注 (Fehr & Gachter, 2002; Kim et al., 2021; Martin et al., 2021; Yang et al., 


2022). 
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上 个 世纪 以 来 , 人们 针对 经 济 决策 与 分 配 行为 开展 了 大 量 研究 。 行为 经 济 学 家 最 早 在 最 
AiR EEE (Ultimatum Game, UG) 中 发 现 了 利他 惩罚 (Thaler, 1988)。 在 该 任务 中 存在 提 
议 者 和 响应 者 两 方 , 他 们 需要 就 一 定数 量 的 资金 如 何 分 配 达 成 一 致 。 首先 由 提议 者 提出 分 配 
方案 ， 若 响应 者 接受 提议 者 提出 的 分 配方 案 ， 则 两 人 按照 这 一 方式 进行 分 配 ， 反 之 ， 两 人 都 
不 能 获得 任何 资金 。 在 这 种 情况 下 , 拒绝 可 以 看 作 是 响应 者 对 提议 者 的 有 代价 的 第 二 方 惩罚 。 
然而 ， 在 现实 世界 中 ， 第 二 方 往往 是 被 动 接受 的 角色 。 并 且 ， 如 果 仅 存在 第 二 方 惩罚 ， 能 够 
维护 的 社会 规范 数量 有 限 ， 因 此 ,引入 第 三 方 惩罚 能 够 扩大 答 罚 违规 者 的 比例 ， 更 好 地 维护 
社会 规范 。 以 Fehr 为 代表 的 学 者 在 实验 室 条 件 下 证 明了 第 三 方 惩罚 的 存在 。Fehr 和 
Fischbacher(2004a) 在 独裁 者 博弈 任务 (Dictator Game, DG) 中 引入 第 三 方 ，DG 与 UG 的 区 别 
在 于 响应 者 不 能 拒绝 独裁 者 (提议 者 ) 提 出 的 分 配方 法 ， 只 能 被 动 地 接受 ， 作 为 第 三 方 观察 者 
的 被 试 在 看 到 独裁 者 的 分 配方 案 后 ， 可 以 通过 付出 一 定 代价 (减少 自己 的 钱 数 ) 来 惩罚 独裁 者 。 
随后 ， 该 范式 成 为 TPP 的 重要 研究 方法 之 一 ， 为 在 实验 室 条 件 下 研究 社会 规范 行为 提供 了 
一 种 新 的 思路 。 研 究 者 在 该 范式 基础 上 操纵 独裁 者 和 响应 者 的 社会 地 位 (Cui et al., 2019; 
Ouyang etal., 2021)、 分 配 不 公平 的 程度 (Sun etal,2013)、 惩 罚 代价 的 高 低 (Cheng et al., 2022) 
以 及 第 三 方 个 体 与 任务 双方 之 间 的 社会 距离 和 群体 关系 (Bernhard et al., 2006; Liu et al., 2018) 


等 变量 来 进一步 探究 TPP 行为 是 否 受 到 社交 情境 或 背景 信息 的 影响 。 除 了 DG, 常用 在 TPP 
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究 中 的 范式 还 包括 公共 物品 博弈 (Zhou et al., 2017; 唐 捷 等 , 2022)、 信 任 博弈 Konishi & 


IN 
Ohtsubo, 2015)、 因 徒 困 境 (Lergetporer et al., 2014)、 正 义 游戏 (Civai et al., 2019) 和 芝加哥 道德 


敏感 任务 (Kim et al., 2021; Meidenbauer et al., 2018) 等 ， 通 常 研究 者 关注 第 三 方 是 否 会 对 违规 
行为 作出 干预 以 及 哪些 因素 会 影响 这 种 干预 行为 。 

随 着 研究 的 深入 , 研究 者 开始 从 电 生 理 和 功能 成 像 层 面 的 证 据 推 测 TPP 行为 背后 的 认 
知 神经 机 制 。 但 是 由 于 研究 方法 的 局 限 性 , 这 些 证 据 大 多 局 限于 某 单 一 成 分 或 者 仅仅 关注 独 
立 脑 区 激活 的 结果 。 并 且 ， 目 前 尚未 形成 对 TPP 行为 背后 认 知 过 程 与 脑 功能 网 络 之 间 联 系 
的 整体 认识 。 因 此， 本 文 对 近 十 年 来 与 TPP 相关 的 研究 进行 梳理 。 首 先进 行文 献 检索 。 英 文 
文献 检索 使 用 Web of Science、PubMed、ScienceDirect 数据 库 ，TPP 的 关键 词 为 “third-party 


— 


punishment” EX “altruistic punishment” E% “social punishment”， 认 知 神经 机 制 的 关键 词 为 


“cognitive” 或 “neural bias” 或 “neural correlates” = “neuroimaging” BK “fMRI”. FIC 
献 检 索 使 用 知 网 、 万 方 、 维 普 数据 库 ，TPP 的 关键 词 为 “第 三 方 惩 罚 ” 或 “利他 惩 神 ”或 “ 社 
SET”, 认 知 神经 机 制 的 关键 词 为 “ 认 知 ”或 “神经 机 制 ” 或 “神经 基础 ”或 “ 脑 成 像 ”。 


同时 , 在 阅读 文 后 参考 文献 时 利用 滚雪球 的 方法 检索 文献 进行 查 漏 补缺 。 截 止 2023 年 4 月 ， 
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{检索 到 文献 1149 篇 ， 文 献 检索 的 时 间 范 围 为 2013 年 4 月 到 2023 4H. Ayi EA 
等 阶段 后 ， 最 终 纳入 文献 数量 为 60， 其 中 涉及 神经 机 制 的 文献 39 篇 。 文 献 纳 入 与 排除 标准 
及 PRISMA 流程 图 见 附录 图 S1。 在 总 结 前 人 研究 的 基础 上 ， 本 文 首先 介绍 TPP 行为 相关 的 
理论 模型 , 从 理论 层面 对 TPP 行为 进行 解读 ; 其 次 , 总 结 参 与 TPP 行为 的 脑 网 络 相关 证 据 ， 

尤其 关注 脑 区 之 间 的 协同 作用 ; 最后， 基于 已 有 的 理论 和 研究 构建 TPP 的 认 知 神经 网 络 模 
型 ， 为 理解 TPP 行为 提供 一 个 新 的 动态 视角 。 


2 第 三 方 惩罚 相关 理论 模型 
TPP 作为 一 种 复杂 的 利他 行为 ， 揭 示 背 后 的 认 知 机 制 能 够 更 好 地 理解 其 发 生 和 发 展 规 
律 。 前 人 研究 发 现 情绪 、 认 知 控制 以 及 情境 等 因素 会 对 TPP 行为 产生 影响 。 然 而 ， 目 前 对 
= TPP 理论 层面 的 认识 仍 有 不 足 , 大 多 数 研究 结果 的 解释 以 社会 价值 决策 相关 的 理论 模型 为 基 
础 。 因 此 ， 我 们 首先 对 能 够 解释 TPP 行为 的 理论 进行 总 结 ， 以 形成 对 TPP 行为 理论 层面 的 
理解 。 这 些 理论 模型 包括 反映 个 体 合作 与 公平 偏好 的 互惠 模型 、 直觉 式 加 工 的 情绪 模型 以 及 
在 强化 学 习 视角 下 ， 将 情绪 和 认 知 因素 融合 起 来 的 双 系 统 模型 。 
2.1 互惠 模型 
“你 帮助 我 ， 我 帮助 你 ” 互惠 指 以 一 种 类 似 的 方式 回报 他 人 的 行为 ， 对 促进 人 类 合作 
具有 重要 意义 (Guala, 2012). TPP 行为 的 产生 包含 两 种 互惠 原则 : 弱 互惠 和 强 互惠 (Fehr & 
Fischbacher, 2003)。 在 TPP 中 ， 弱 互惠 一 般 指 间接 互惠 ， 个 体 将 TPP 这 一 高 成 本 利他 行为 作 
为 一 个 “可 信 ? 的 信号 来 向 他 人 暗示 自己 拥有 公平 公正 的 高 尚 品质 , 藉 此 在 群体 中 建立 声誉 ， 
以 便于 在 今后 的 人 际 交 往 中 获得 更 多 的 机 会 和 合作 ， 进 而 实现 间接 获 益 (Jordan, Hoffman et 
© al., 2016; Rai, 2022)。 与 期 望 获 益 的 弱 互 惠 不 同 ， 强 互惠 认为 个 体 是 出 于 维护 公平 的 动机 来 
惩罚 不 公平 的 行为 (Ciaramidaro et al., 2018)， 即 使 实施 惩罚 需要 付出 代价 ， 且 这 些 代 价 不 一 
定 能 够 得 到 补偿 。 强 互惠 者 的 存在 保证 了 群体 利益 , 也 使 得 人 和 人 之 间 的 广泛 合作 成 为 可 能 
符合 进化 原则 (Buckholtz & Marois, 2012). 
互惠 模型 从 宏观 的 视角 解释 了 TPP 的 发 生机 制 ， 指 出 个 体 是 在 基于 合作 与 公平 的 情况 
下 做 出 的 惩罚 行为 。 然 而 ， 该 模型 也 有 不 足 之 处 。 首 先 ， 间 接 互 惠 强 调 个 体 第 三 方 惩罚 的 目 
的 是 获取 间接 利益 。 在 单 试 次 或 者 匿名 情况 下 ， 由 于 个 体 几 乎 不 存在 未 来 的 合作 机 会 ， 或 者 
无 法 辨识 身份 ， 因 此 并 不 存在 声誉 动机 。 以 往 研究 揭示 即使 在 这 种 情况 下 , 个 体 依旧 会 执行 
TPP, 并 且 发 生 概率 高 于 1/2. 例如, Piazza 和 Bering(2008) 发 现在 第 三 方 完 全 匿名 的 条 件 下 ， 
71.4% 的 参与 者 选择 牺牲 1/3 的 资金 去 惩罚 违规 者 ，Feng 等 人 (2022) 也 发 现在 单 次 匿名 实验 
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中 个 体 的 平均 惩罚 率 大 于 50%。 国 内 研究 者 杨 莎 莎 和 陈 思 静 (2022) 同 样 发 现在 单 次 匿名 博弈 
中 不 惩罚 或 低 惩罚 的 情况 并 不 常见 (3.15%)。 此 外 ， 最 近 的 研究 发 现 即使 是 未 涉足 社会 的 仅 
八 个 月 大 的 婴儿 就 已 经 能 够 使 用 目光 来 惩罚 违规 者 (Kanakogi et al., 2022)。 以 上 研究 发 现 都 
无 法 用 间接 互惠 来 解释 。 其 次 ， 强 互惠 没有 考虑 到 惩罚 所 带 来 的 报复 性 行为 ， 这 并 不 利于 群 
体 的 发 展 和 稳定 。 最 后 ， 强 互惠 惩罚 是 一 种 自愿 的 惩罚 行为 ， 其 强度 对 惩罚 成 本 十 分 敏感 
若 惩罚 成 本 过 高 , 第 三 方 作为 利益 无 关 者 在 理性 的 考虑 下 对 需要 自己 承担 成 本 来 实施 惩罚 的 
需求 便 会 降低 。 可 见 ， 仅 从 公平 、 合 作 的 互惠 角度 来 理解 TPP 行为 存在 一 定 的 局 限 性 。 
2.2 情绪 模型 

“情感 即 信息 ”模型 (affect-as-information) 指 出 , 情感 是 一 种 简化 判断 的 启发 式 工具 , 可 


以 作为 决策 过 程 中 的 信息 来 源 指导 决 策 (Bright & Goodman-Delahunty, 2006)， 进 而 影响 个 体 


的 后 续 决 策 (Zhao et al., 2022)。 负 性 情绪 产生 是 TPP 的 动机 来 源 之 一 (Fehr & Fischbacher, 


2004a; Fehr & Gichter, 2002; Xiao & Houser, 2005)。 个 体 观 察 到 违规 行为 发 生 时 会 产生 一 系 
列 的 负 性 情绪 ， 包 括 对 违规 者 的 愤怒 (Jordan, McAuliffe, & Rand, 2016) 以 及 对 自私 意图 


(McAuliffe et al., 2015) 和 不 公平 (Raihani & McAuliffe, 2012; Sun et al., 2015) 的 厌恶 。 此 时 个 
体 的 初衷 可 能 是 想 通 过 惩罚 违规 者 的 方式 来 缓解 自己 的 负 性 情绪 , 而 维护 社会 规范 只 是 一 种 
“额外 获 益 ”(de Quervain et al., 2004)。 

但 也 有 研究 学 者 发 现 , 负 性 情绪 并 不 一 定 导致 惩罚 行为 。 例如 ,Qu 等 人 (2014) 采 用 第 三 
方 惩罚 的 DG 任务 发 现 ,在 负 性 情绪 与 惩罚 成 本 导致 的 经 济 损失 冲突 之 下 ,个 体 选 择 “ 不 惩 
昼 ” 的 情况 也 会 有 发生。 另外， 在 个 体 情 绪 激 活 相 同 的 情况 下 ， 惩 罚 程 度 仍然 存在 差异 。 研 究 
发 现 ,即使 个 体 对 分 配 不 公平 程度 的 感知 相同 ， 即 不 公平 厌恶 程度 相同 ， 最 终 的 惩 避 程度 还 

会 因 惩罚 成 本 的 不 同 而 发 生 改 变 (Cheng etal,2022)。 以 上 研究 表明 ， 情 绪 可 能 影响 了 反应 
判断 的 某 个 阶段 ， 最 终 的 惩罚 决策 是 结合 各 方面 因素 综合 考量 的 结果 ,包括 情绪 、 公 平和 自 
利 的 权衡 。 

2.3 强化 学 习 视角 下 的 双 系 统 模型 

强化 学 习 (reinforcement learning, RL) 指 个 体 通 过 接收 环境 的 反馈 信息 进行 学 习 并 不 断 调 
整 行为 策略 ， 是 一 种 奖励 学 习 的 方法 (K6ster et al., 2022; Morris et al., 2017)。 双 系统 理论 认 
为 ， 社 会 决策 受到 自动 加 工 和 控制 加 工 两 个 系统 的 影响 (Chung et al., 2023)。 前 者 属于 自 下 而 
上 的 启发 式 加 工 过 程 ， 负 性 情绪 的 产生 促使 惩罚 成 为 自动 化 优势 反应 (Mussel et al., 2018), 
对 应 着 RL 中 无 模型 (model-free, ME) 的 策略 ;后 者 属于 自 上 而 下 的 加 工 ， 个 体会 在 理性 、 经 


验 的 引导 下 选择 最 优 的 行为 方式 (Zhou etal., 2014), 对 应 着 RL 中 基于 模型 (model-based, MB) 
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的 策略 。 以 往 研 究 表明 , 个 体 的 最 终 决 策 属 于 双 系 统 之 间 的 动态 平衡 ( 张 莫 等 ,2018)。 其 中 ， 


ME 以 直觉 冲动 的 方式 (最 少 成 本 六 


行 决策 ， 同 时 又 会 受到 MB 的 影响 和 控 人 


出， 体现 了 个 体 


在 不 同系 统 的 互动 中 探索 适应 性 的 行为 (Gershman et al., 2014; Lee et al., 2014)。 


在 TPP 中 ， 当 违规 行为 发 生 时 ， 个 体 的 自动 化 情感 评价 激活 了 惩罚 行为 ， 体 现 了 情绪 


对 惩罚 的 驱动 (Qu et al., 2014); 当 直 觉 反 应 和 经 济 利益 产生 冲突 时 ，MB 对 MF 进行 认 知 控 


制 ， 最 终 的 惩罚 决定 是 个 体 “深思 熟 虑 ”后 的 结果 ( 殷 西 乐 等 ,2019)。 和 您 罚 行为 发 生 后 ， 其 


带 来 的 满足 感 和 权力 的 体验 感 (Delgado et al., 2003; Strobel et al., 2011; Yamagishi et al., 2017) 


励 信号 进行 内 部 强化 ， 促 使 个 体 做 出 下 一 次 惩罚 行为 。 

该 模型 将 传统 的 双 系统 理论 以 强化 学 习 的 视角 展现 出 来 , 从 一 个 全 新 的 角度 探讨 了 TPP 
行为 的 发 生 和 发 展 过 程 。 具体 来 说 , 该 模型 不 仅 将 情绪 和 认 知 因素 结合 起 来 ， 
是 一 个 有 反馈 和 强化 参与 的 动态 过 程 , 个 体会 在 每 一 次 的 反馈 中 进行 学 习 , 最 终 形成 稳定 的 
行为 模式 。 然 而 ， 该 模型 并 未 涉及 个 体 对 违规 行为 原因 的 推测 。 有 研究 指出 ， 对 故意 违规 者 


的 意图 评估 可 能 会 抑制 杏仁 核 的 活动 ， 减 少 因 情 绪 冲 动产 生 的 惩罚 (Treadway et al., 2014). 


这 启示 我 们 未 来 在 利用 该 模型 对 TPP 行为 的 产生 机 制 进行 解释 时 ， 还 应 考虑 对 违规 者 心理 


状态 的 评估 这 一 重要 因素 。 


帮助 个 体 建立 了 较 高 的 自尊 水 平 , 并 联合 负 性 情绪 的 消解 以 及 对 未 来 回报 的 期 待 共同 作为 奖 


还 指出 TPP 应 


以 上 理论 模型 从 不 同 的 角度 阐述 了 TPP 行为 产生 的 机 


Hl, SAT, IAFL RAL HT TPP 


行为 的 解释 存在 一 定 的 局 限 性 。 越 来 越 多 的 研究 者 将 TPP 看 作 一 个 有 反馈 参与 的 动态 性 过 
程 。 所谓 动态 性 ， 指 需要 满足 多 系统 性 和 时 间 性 两 个 特征 (Kozlowski & Igen 
为 一 种 复杂 的 社会 行为 ， 其 产生 可 能 是 个 体 情绪 、 认 知 和 奖赏 等 多 个 系统 交互 作用 的 结果 ， 
符合 多 系统 性 ; 另外 , 奖赏 反馈 的 存在 使 得 个 体 可 以 在 每 一 次 强化 中 对 TPP 行为 进行 调整 ， 


事件 相关 电位 (event-related potential, ERP)E 


究 也 发 现在 不 同 的 阶段 会 有 不 同 的 脑 电 成 分 出 


,2006)。TPP 作 


现 ， 如 分 别 在 刺激 后 200~350ms 和 300~900ms 左右 达到 峰值 的 内 侧 额 叶 负 波 (medial frontal 


negativity, MFN) 和 了 晚期 正成 分 (late positive component, LPC), 
相关 (Cui et al., 2019; Qu et al., 2014)， 符 合 时 间 性 的 特征 。 
早 在 2011 年 ，Strobel 等 人 就 提出 了 在 强 互惠 行为 背后 ， 认 知 -情感 -动机 网 络 作 为 利他 
惩罚 驱动 力 的 观点 ， 但 由 于 在 实验 中 缺乏 情绪 评分 ， 无 法 直接 得 晶 


TPP 行为 的 结论 ， 随 后 ，Buckholtz 和 Marois(2012) 指 出 TPP 的 成 功 执行 


X 


其 波幅 大 小 与 后 续 的 惩罚 程度 


8 到底 是 哪 种 情绪 影响 了 


需要 责任 评估 和 第 


罚 选 择 两 个 独立 认 知 机 制 的 支撑 ,一 定 程度 上 将 认 知 与 行为 决策 结合 起 来 , 但 没有 纳入 情绪 


因素 的 影响 。 目 前 ， 许 多 研究 致力 于 说 


E 明 情感 和 认 知 塑造 了 人 类 的 亲 社 会 行为 ， 但 对 决策 的 
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具体 过 程 以 及 情绪 和 认 知 相互 作用 的 机 制 仍 不 了 解 (Rahal & Fiedler, 2022)， 且 相关 研究 证 据 
分 布 零 散 , 缺乏 整体 认识 。 借助 神经 层面 上 的 证 据 有 助 于 对 决策 者 做 出 决定 时 的 复杂 认 知 和 
情感 过 程 进行 更 细致 的 理解 。 因 此 ， 我 们 回顾 与 TPP 相关 的 功能 神经 成 像 和 电 生 理 相 关 的 
证 据 ， 尤 其 关注 脑 网 络 内 部 和 脑 网 络 之 间 的 联系 ， 为 理解 TPP 行为 呐 定 神经 层面 的 基础 。 
3 ”参与 第 三 方 惩罚 的 脑 网 络 

以 往 研究 表明 TPP 包含 情绪 产生 、 意 图 和 伤害 程度 评估 以 及 选择 惩罚 阶段 。 结 合 前 人 
究 中 相关 脑 网 络 的 功能 与 激活 模式 (Bellucci et al., 2020; Krueger & Hoffman, 2016; Lo Gerfo 
etal., 2019)， 本 文 认为 TPP 行为 的 产生 分 为 “情绪 产生 ”人 “责任 评估 ”和 “惩罚 选择 ”三 个 

阶段 , 与 之 相对 应 的 脑 网 络 为 突显 网 络 (salient network)、 默 认 模 式 网 络 (default mode network) 
和 中 央 执 行 网 络 (central executive network)。 此 外 ， 奖 赏 网 络 协作 TPP 加 工 过 程 ， 主 要 起 价 
值 表 征 、 预 期 奖赏 的 作用 。 相 关 脑 网 络 所 包含 的 脑 区 及 其 位 置 见 图 1。 
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图 1 第 三 方 惩罚 相关 脑 网 络 及 其 脑 区 位 置 


背 侧 前 扣 带 皮层 (dorsal anterior cingulate cortex, dACC)， 前 脑 岛 皮层 (anterior insula cortex, AIC)， 禁 仁 核 (Amygdala)， 后 扣 带 


pr 


皮层 (posterior cingulate cortex, PCC), 背 内 侧 前 额 叶 皮层 (dorsomedial prefrontal cortex, dmPFC), 里 项 联 合 区 (temporoparietal junction, 


TPJ)， 背 外 侧 前 额 叶 皮层 (dorsomedial prefrontal cortex, dIPFC)， 腹 外 侧 前 额 叶 皮 层 (ventrolateral prefrontal cortex, vIPFC)， 后 顶 叶 


皮层 (posterior parietal cortex, PPC)， 顶 叶 内 沟 (intraparietal sulcus, IPS)， 腹 侧 纹 状 体 (ventral striatum, VS)， 腹 内 侧 前 额 叶 皮层 


(ventromedial prefrontal cortex, vmPFC)， 中 脑 腹 侧 被 盖 区 (ventral tegmental area, VTA). 
3.1 突显 网 络 

是 一 种 默认 的 社会 规范 (Civai, 2013)， 当 违规 行为 发 生 时 ， 个 体会 产生 愤怒 、 不 公 
平 厌 恶 等 负 性 情绪 ， 这 种 愤怒 和 厌恶 属于 以 他 人 为 中 心 的 道德 情绪 (Pedersen et al., 2018)。 此 
外 ， 当 个 体 预 期 自己 应 当 惩罚 违规 者 以 维护 正义 却 没有 这 样 做 时 , 会 产生 以 自我 为 中 心 的 内 
A (Nelissen & Zeelenberg, 2009), 这 种 内 次 感 在 一 定 程度 上 促进 愤怒 情绪 的 产生 (Rothschild 


& Keefer, 2018)。 因 此 ， 突 显 网 络 负 责 检测 冲突 并 产生 愤怒 、 厌 恶 、 内 次 等 负 性 情绪 (Bellucci 


> 
4 


et al., 2020; Buckholtz & Marois, 2012; Feng et al., 2016; Mclatchie et al., 2016), 主要 脑 区 包括 


背 侧 前 扣 带 皮层 (dorsal anterior cingulate cortex, (ACC). fil fii 44 Z (anterior insula cortex, AIC) 
MEIZ. 


前 人 研究 指出 ，dACC 在 监测 认 知 冲突 中 发 挥 着 重要 作用 (Wang et al., 2017), AIC 与 负 
性 情绪 表征 相关 (Shenhav et al., 2016; Singer et al., 2009)。Craig(2009) 将 这 两 者 整合 到 脑 岛 功 
能 模型 中 ， 认 为 它们 共同 参与 情绪 加 工 。 当 个 体 观察 到 不 公平 行为 时 ，dACC 和 AIC 负责 监 
测 违反 规范 的 情况 或 威胁 (Feng et al., 2016)， 并 由 AIC 标记 违规 信号 和 产生 不 公平 厌恶 反应 
(Civai et al., 2012; Hu, Blue et al., 2016)。 研 究 发 现 AIC 激活 程度 与 分 配 不 公平 程度 呈正 相关 


(Zhong et al., 2016)。 相 关 ERP 研究 也 发 现在 该 过 程 中 源 定 位 在 前 扣 带 皮层 (anterior cingulate 


cortex, ACC) 附 近 的 MEN 波幅 增 大 ， 该 成 分 对 社会 期 望 和 社会 规范 的 违反 敏感 (Mothes et al., 


2016; Sun et al., 2015; van der Helden et al., 2010; Wu et al., 2011)。 这 些 研究 结果 体现 了 dACC 
和 AIC 可 能 对 应 结果 的 早期 评价 加 工 过 程 。 另 外 , 禁 仁 核 作为 社会 与 情感 的 重要 脑 区 之 一 ， 


在 TPP 中 负责 根据 受害 者 的 受伤 害 程度 产生 情感 唤醒 信号 (Buckholtz & Marois, 2012; 


Krueger & Hoffman, 2016)， 并 参与 决定 了 惩罚 的 严重 程度 (Stallen et al., 2018)。 简 单 来 说 ， 
AIC 和 杏仁 核 体现 了 对 不 公平 行为 反应 决策 的 两 个 不 同方 面 , 前 者 反映 了 个 体 的 社会 偏好 与 
惩罚 意愿 ;后 者 反映 了 个 体 的 情感 体验 并 且 影 响 每 罚 程度 (Civai et al., 2019)。 综 上 ， 突 显 网 
络 在 TPP 中 负责 对 违规 行为 进行 检测 ， 参 与 情绪 加 工 并 指导 后 续 决 策 ， 为 情绪 模型 提供 了 
证 据 支 持 。 然 而 ， 有 研究 者 指出 ， 以 AIC 为 核心 的 突显 网 络 启 动 并 调节 了 大 脑 其 他 区 域 参 
与 的 认 知 -情感 -动机 过 程 (Menon & Uddin, 2010)。 因 此 我 们 推测 ， 突 显 网 络 在 TPP 过 程 中 起 
到 重要 作用 。 
3.2 默认 模式 网 络 

个 体 在 做 出 惩罚 决策 之 前 , 需要 对 违规 行为 的 伤害 程度 和 伤害 意图 进行 评估 , 并 将 其 整 
合 到 责任 的 评估 ， 从 而 形成 “惩罚 信号 ” 该 过 程 所 涉及 的 网 络 称 为 默认 模式 网 络 ， 主 要 包 


括 内 侧 前 额 叶 皮 层 (medial prefrontal cortex, mPFC) 和 显 顶 联合 区 (temporoparietal junction, 


X 


TPJ)。 其 中 ， 腹 内 侧 前 额 叶 皮层 (ventromedial prefrontal cortex, vmPFC) 负 责 对 受伤 害 的 程度 
进行 评估 (Bellucci et al.,2017)， 与 杏仁 核 的 功能 连接 增强 表明 这 两 个 区 域 可 能 共同 负责 伤害 


程度 的 情感 编码 (Treadway et al., 2014) 。 背 内 侧 前 额 叶 皮层 (dorsomedial prefrontal cortex, 


dmPFC) 和 TPJ 与 推断 他 人 心理 状态 有 关 (Jamali et al., 2021; Morese et al., 2016; Xie et al., 2020; 


Yang, Shao et al., 2019). dmPFC 与 TPJ 在 TPP 中 负责 对 伤害 者 的 意图 进行 评估 ， 并 且 其 激 


活 程度 及 两 者 的 功能 连接 强度 与 惩罚 程度 呈 负 相关 (Baumgartner et al., 2012, 2014; Moll et al., 
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2018; Zinchenko etal.,2019)。 这 可 能 是 个 体 对 违规 行为 进行 了 合理 的 推测 与 解释 。 当 伤害 是 
意 发 生 时 , TPJ-mPFC 环 路 会 抑制 杏仁 核 的 活动 , 使 得 您 罚 程度 降低 (Treadway et al., 2014). 
这 体现 了 对 违规 者 心理 状态 评估 在 TPP 行为 实施 过 程 中 起 到 的 重要 作用 。 

前 人 研究 发 现 ,在 与 TPP 相关 的 大 脑 区 域 之 间 存 在 一 种 独特 的 连接 方式 ,dmPFC 是 TPP 
激活 模式 的 中 枢 (Bellucci et al., 2017; Feng et al., 2016)。 中 枢 (hub) 是 指 在 格 兰 杰 因果 分 析 
(Granger causality analysis) 中 与 其 他 节点 有 最 大 数量 因果 联系 的 大 脑 区 域 ， 是 信息 交流 的 中 
心 节点 (Yang etal., 2023), 在 这 里 体现 为 dmPFC 与 其 他 脑 区 之 间 有 更 多 数量 的 功能 连接 。 结 
合 不 同 脑 区 的 功能 ， 我 们 对 默认 模式 网 络 作用 方式 做 出 如 下 推测 (图 2): (temporal pole, 
TP) 负 责 理解 违规 行为 ， 并 向 dmPFC 提供 伤害 信息 。dmPFC 在 接收 到 伤害 信息 之 后 对 伤害 
意图 进行 评估 ， 并 向 其 他 区 域 传递 信息 ， 包 括 后 扣 带 皮层 (posterior cingulate cortex, PCC), 
vmPFC 和 TPJ。 其 中 ，PCC 负责 整合 与 违规 行为 相关 的 背景 信息 ，vmPFC 负责 编码 伤害 程 
度 ，TPJ 负责 推断 意图 ， 最 后 由 mPFC 整合 伤害 与 意图 两 部 分 信息 ， 形 成 “惩罚 信号 ”( 谢 东 


A, Trt, 2019). 


EA 


一 一 惩罚 信号 


图 2 第 三 方 惩罚 行为 在 默认 模式 网 络 的 作用 路 径 


注 : 里 极 (temporalpole,TP), 背 内 侧 前 额 叶 皮 层 (dorsomedial prefrontal cortex, dmPFC), 后 扣 带 皮层 (posterior cingulate cortex, PCC), 


腹 内 侧 前 额 叶 皮层 (ventromedial prefrontal cortex, vmPFC)， 标 项 联合 区 (the temporoparietal junction, TPJ)， 内 侧 前 额 叶 皮层 (medial 


prefrontal cortex, mPFC)， 箭 头 代 表 信 息 传 递 方向 。 


值得 注意 的 是 ，dmPFC 和 TPS 都 有 着 推断 意图 的 作用 ， 是 认 知 心智 化 的 关键 脑 区 (Feng 


et al., 2022)。 此 外 ，vmPFC 和 杏仁 核 与 情感 心智 化 相关 (Anne et al., 2012)， 有 人 提出 这 四 个 


脑 区 共同 组 成 心智 化 网 络 (mentalizing network)(Feng et al., 2016; Glass et al., 2016)。 心 智 化 网 
络 能 够 推断 他 人 心理 状态 ,减弱 对 违规 行为 的 监测 , 降低 社会 规范 的 价值 计算 水 平 。 实 际 上 ， 


Bellucci 等 人 (2017) 认 为 默认 模式 网 络 和 心智 化 网 络 在 本 质 上 属于 同一 网 络 ， 而 男 一 些 研究 
8 


者 则 认为 默认 模式 网 络 和 心智 化 网 络 在 TPP 中 应 各 司 其 职 ， 共 同 影 响 TPP 行为 (Lo Gerfo et 
al., 2019)。 两 者 虽 在 关系 上 存在 不 一 致 的 说 法 ,但 不 可 否认 的 是 二 者 不 管 是 在 结构 上 还 是 功 
能 上 都 存在 相似 性 , 默认 模式 网 络 更 加 侧重 于 对 违规 行为 整体 的 责任 评估 , 而 心智 化 网 络 强 
周 对 他 人 心理 状态 的 推断 。 换言之 , 默认 模式 网 络 可 能 是 通过 心智 化 网 络 起 到 责任 评估 的 作 
， 两 者 间 是 相辅相成 、 共 同 作 用 的 。 
3.3 中 央 执 行 网 络 

Buckholtz 等 人 (2015) 认 为 , 责任 评估 和 乱 罚 选择 属于 两 个 独立 的 认 知 机 制 ， 后 者 所 对 应 
的 脑 网 络 是 中 央 执 行 网 络 。 中 央 执 行 网 络 在 TPP 中 负责 将 默认 模式 网 络 发 出 的 “惩罚 信号 ” 


转变 为 “惩罚 行为 ”(Lo Gerfo et al., 2019; Zinchenko & Klucharev, 2017)。 相 关 脑 区 包括 背 外 侧 


te 


前 额 叶 皮层 (dorsomedial prefrontal cortex, dIPFC). Ja Jit! /% (posterior parietal cortex, PPC) 
和 顶 叶 内 沟 (intraparietal sulcus, IPS). 

当中 央 执 行 网 络 接收 到 默认 模式 网 络 传 来 的 “惩罚 信号 ”时 ，IPS 负责 将 场景 与 惩罚 行 
为 联系 起 来 , PPC 负责 构建 惩罚 类 型 等 级 表 , 最 后 由 dlPFC 在 等 级 表 中 选择 特定 惩罚 ， 代 于 


最 终 输出 (Buckholtz et al., 2008; Glass et al., 2016; Krueger & Hoffman, 2016). KEW AHE H 


a 


FE 


dlPFC 在 认 知 控制 即 抑制 负 性 情绪 和 自 利 倾向 中 起 着 重要 作用 (Knoch et al., 2006, 2008; 


Sanfey et al., 2003; 罗 艺 等 ,2013)， 该 结论 在 TPP 中 也 得 到 了 验证 (Feng et al., 2016; rR 

等 , 2019)。 相 关 ERP 研究 发 现 ， 晚 期 成 分 LPC 波幅 与 认 知 努力 程度 相关 (Cui et al., 2018; 
Johnson et al., 2008)， 表 明 最 终 的 惩罚 决策 是 负 性 情绪 和 自 利 机 制 权 衡 的 结果 。 此 外 ，dlPFC 
还 与 目标 导向 行为 的 整合 与 选择 相关 ( 罗 艺 等 , 2013)， 若 利用 重复 经 上 据 磁 刺激 (repeated 
transcranial magnetic stimulation, rTMS) 抑 制 dIPFC 活动 会 干扰 最 终 的 惩罚 决定 (Buckholtz et 
al., 2015)。 由 上 我 们 推测 ，dlPFC 作为 中 央 执 行 网 络 的 核心 脑 区 ， 其 激活 体现 了 认 知 控制 在 
反应 判断 后 期 所 起 到 的 重要 作用 , 也 为 双 系 统 模型 下 控制 系统 的 存在 提供 了 神经 层面 上 的 证 
据 支 持 。 

此 外 ， 在 中 央 执 行 网 络 中 还 存在 另 一 个 重要 脑 区 一 一 腹 外 侧 前 额 叶 皮层 (ventrolateral 
prefrontal cortex, VIPFC)。Glass 等 人 (2016) 指 出 vIPFC 虽然 对 TPP 的 顺利 实施 很 重要 ， 但 却 
与 其 没有 内 在 联系 ， 然 而 Bellucci 等 人 (2020) 的 一 项 元 分 析 发 现 TPP 会 持续 激活 VIPFC。 令 
人 遗憾 的 是 ， 目 前 没有 研究 直接 关注 vIPFC 与 TPP 行为 的 关系 。 前 人 研究 已 证 实 VIPFC 是 
亲 社 会 行为 调控 中 的 一 个 关键 脑 区 (Yang, Zheng et al., 2019)， 因 此 我 们 推测 vIPFC 可 能 在 抑 
制 以 伤害 为 目的 的 惩罚 冲动 、 促 进 更 加 公平 的 制裁 中 发 挥 重要 作用 。 未 来 的 研究 需要 进一步 
将 vIPFC 作为 目标 区 域 来 探究 其 在 TPP 中 的 功能 
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3.4 奖赏 网 络 

TPP 行为 的 产生 涉及 奖赏 加 工 ， 特 别 是 内 部 奖赏 。 根 据 RL 理论 ， 个 体 对 违规 者 进行 征 
罚 而 获得 满足 感 和 权力 体验 感 会 作为 内 部 奖赏 促使 个 体 做 出 下 一 次 惩罚 行为 ， 这 也 是 TPP 
行为 得 以 进化 的 近 端 机 制 ( 张 耀 华 等 , 2013)。Briine 等 人 (2021) 发 现 亨廷顿 病 患 者 能 够 理解 
不 公平 行为 本 身 ， 却 可 能 因为 缺乏 奖赏 体验 能 力 而 导致 TPP 行为 减少 ， 体 现 了 奖赏 加 工 在 
TPP 中 发 挥 的 重要 作用 。 在 神经 层面 上 ， 不 少 研究 发 现 TPP 会 激活 奖赏 加 工 相关 的 脑 区 ， 
主要 包括 腹 侧 纹 状 体 (ventral striatum, VS) 和 vmPFC(Hu et al., 2015)， 两 者 与 中 脑 腹 侧 被 盖 区 
(ventral tegmental area, VTA) 相 连 ， 分 别 构成 中 脑 边 缘 通路 和 中 脑 皮 质 通 路 (Ikemoto, 2010). 
中 脑 边缘 通路 中 的 VS 在 预期 未 来 奖赏 中 发 挥 重要 作用 (ODoherty et al., 2004), 7£ TPP 中 其 
激活 程度 及 其 与 vmPFC 的 功能 连接 增强 (Hu etal., 2015)。 中 脑 皮 质 通 路 中 的 vmPFC 是 情感 
> 和 认 知 处 理 的 关键 脑 区 (Naqvi et al., 2006; 刘 映 杰 等 , 2022)。 前 文 所 提 到 的 vmPFC 对 伤害 
AN 程度 的 评估 体现 了 其 将 情绪 整合 到 TPP 中 的 功能 (Asp et al., 2019)。 在 认 知 加 工 上 ，vmPFC 
负责 决策 中 的 主观 价值 评估 (Ruff & Fehr, 2014)， 其 激活 会 正 向 强化 社会 奖赏 (Zhong et al., 
2016)。 以 上 证 据说 明 ， 奖 赏 网 络 在 TPP 中 主要 负责 价值 表征 、 预 期 奖赏 的 作用 。 

此 外 ，VTA 语 含 神经 递 质 多 巴 胺 ， 其 在 中 脑 边缘 通路 和 中 脑 皮质 通路 神经 传导 过 程 ， 
= 起 到 重要 作用 (Wise & Rompre, 1989)。 具 体 来 说 , 多 巴 胺 负责 编码 奖赏 预测 偏差 (Schultz, 2007, 
R 2013)。 当 大 脑 监测 到 结果 比 预期 更 差 时 ， 由 ACC 和 多 巴 胺 系统 对 该 信号 进行 编码 ， 这 可 能 
是 在 脑 电 研究 中 发 现 MEN 在 违反 预期 条 件 下 出 现 的 原因 (Enge et al., 2017; 吴燕 ， 罗 跃 嘉 ， 
2011)， 这 可 以 解释 在 个 体 观察 到 不 公平 分 配 后 MEN 波幅 增 大 的 现象 (Ouyang et al., 2021). 
大 量 研究 发 现 ，dlPFC 和 dACC 等 脑 区 在 TPP 中 的 活动 会 受到 来 自 中 脑 多 巴 胺 能 神经 元 信 
号 输入 的 调节 (Lockwood et al., 2016)。 多 巴 胺 功能 分 子 的 遗传 变异 可 用 于 解释 个 体 间 在 TPP 
中 神经 激活 的 差异 。COMT Met 等 位 基因 与 体验 奖赏 的 能 力 有 关 ， 该 基因 携带 者 在 TPP 中 
VS 有 更 强 的 激活 (Strobel etal.,2011D)。 由 此 可 以 说 明 ， 多 巴 胺 水 平 在 TPP 决策 中 有 着 重要 影 
响 ， 且 该 过 程 与 奖赏 加 工 密切 相关 。 
4 第 三 方 惩罚 的 认 知 神经 网 络 模型 

前 人 在 TPP 相关 神经 机 制 上 开展 了 大 量 研究 ， 但 大 多 仅仅 关注 了 TPP 行为 出 现时 大 脑 
各 部 位 的 独立 激活 。 近 年 来 有 学 者 对 TPP 持续 激活 的 神经 网 络 进行 了 元 分 析 (Bellucci et al., 
2020)， 但 依旧 对 大 脑 区 域 和 网 络 之 间 的 相互 作用 缺乏 理解 。 此 外 ， 奖 赏 网 络 作 为 TPP 中 与 
动机 关系 最 为 密切 的 一 个 区 域 , 与 其 他 脑 网 络 之 间 的 关系 还 不 明确 。TPP 作为 一 种 复杂 的 社 
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会 决策 行为 , 其 激活 的 脑 区 广泛 而 复杂 。 因 此 ,有 必要 将 心理 和 神经 层面 上 的 证 据 整 合 起 来 ， 
形成 更 加 系统 的 理解 。 为 了 从 更 全 面 的 视角 解释 TPP 行为 的 发 生机 制 ， 本 文 整合 了 以 往 研 
究 结果 ， 总 结 梳理 个 体 在 TPP 中 的 情绪 唤醒 、 认 知 过 程 以 及 脑 区 激活 模式 (文献 详细 信息 见 
附录 表 S1)， 提 出 TPP 的 认 知 神经 网 络 模型 (图 3)。 在 该 模型 中 ， 情 绪 系统 和 奖赏 系统 共同 
作为 TPP 的 动机 系统 ， 负 责 为 TPP 行为 产生 动力 ， 对 应 的 脑 网 络 分 别 为 突显 网 络 和 奖赏 网 
络 。 社会 认 知 系统 和 执行 控制 系统 作为 认 知 系统 的 两 个 子 系统 , 参与 TPP“ 责 任 评估 ”和 “ 惩 
罚 选 择 ” 两 个 阶段 ， 对 应 的 脑 网 络 分 别 为 默认 模式 网 络 和 中 央 执 行 网 络 。 模 型 中 各 个 成 分 互 
相配 合 、 相 互 作用 ， 最 终 由 执行 控制 系统 做 出 是 否 惩 避 以 及 惩 昼 强度 的 决策 ,由 此 产生 的 反 
馈 信息 又 进一步 作用 于 内 部 环 路 , 个 体 在 每 一 次 的 反馈 中 进行 学 习 并 形成 最 优 行为 决策 。 对 
该 模型 的 理解 包括 以 下 四 个 方面 : (1) 动 机 系统 下 的 情绪 系统 和 奖赏 系统 ，(2) 认 知 系统 内 部 
关系 及 其 对 第 三 方 惩 如 行为 的 影响 ，(3) 自 动 加 工 与 控制 加 工 通路 ，(4) 奖 赏 网 络 参 与 的 反馈 
通路 。 
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图 3 第 三 方 惩罚 行为 的 认 知 神经 网 络 模型 


注 : 虚线 矩形 框 代表 认 知 加 工 系统 ， 实 线 矩 形 框 代表 各 系统 下 的 子 系统 ， 椭 圆 框 代表 行为 决策 。 单 向 实 线 第 头 4、2、3、 涌 代 


表 一 次 完整 的 惩罚 过 程 ， 数 字 越 大 ， 阶 段 越 后 ;箭头 1 代表 刺激 和 输入， 箭头 2 代表 对 动机 系统 信息 的 整合 与 传递 ， 箭 头 3 代表 


社会 认 知 系统 将 整合 后 的 “惩罚 信号 ”进一步 输送 给 执行 控制 系统 ， 箭 头 4 代表 惩罚 决策 输出 。 双 向 实 线 箭 头 (5、6) 代 表 系 统 


或 网 络 之 间 的 相互 关系 : 箭头 5 代表 情绪 系统 和 奖赏 系统 之 间 的 相互 关系 ， 箭 头 6 代表 默认 模式 网 络 和 中 央 执 行 网 络 之 间 的 


“ 持 抗 ”和 “互补 ”关系 。 虚 线 箭头 (7) 代 表 执 行 惩罚 后 的 反馈 过 程 ， 参 与 下 一 次 第 三 方 惩罚 行为 。 
4.1 动机 系统 下 的 情绪 系统 和 奖赏 系统 

情绪 模型 指出 ， 负 性 情绪 的 产生 是 TPP 的 动力 来 源 之 一 (Fehr & Gichter, 2002; Xiao & 
Houser, 2005)， 而 互惠 模型 认为 对 未 来 回报 的 期 待 ( 如 声誉 建立 ) 以 及 惩 昼 后 的 权力 体验 感 、 
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满足 感 可 以 作为 奖赏 信号 对 个 体 进行 内 部 强化 ,促使 个 体 做 出 下 一 次 惩罚 行为 。 因 此 ,情绪 
和 奖赏 系统 都 参与 到 TPP 的 动机 产生 过 程 中 ， 并 共同 组 成 TPP 的 动机 系统 。 情 绪 系 统 涉及 


情绪 的 产生 、 处 理 和 调节 过 程 (Etkin et al., 2015; Pessoa, 2017)。 以 往 研 究 发 现 ， 突 显 网 络 在 


TPP 中 参与 情绪 加 工 并 指导 后 续 决 策 (Bellucci et al., 2020; Feng et al., 2016; Mclatchie et al., 
2016)， 奖 党 网 络 的 价值 表征 和 预期 奖 党 的 功能 使 得 其 与 奖 党 系统 密切 相关 (Hu et al., 2015). 
因此 ,情绪 系统 和 奖赏 系统 对 应 的 脑 网 络 分 别 为 突显 网 络 和 奖 党 网络。 值得 注意 的 是 ,情绪 
系统 和 奖赏 系统 也 并 非 完 全 独立 (箭头 3)。 人 情绪 系统 将 负 性 情绪 的 产生 等 情绪 信息 传递 给 奖 
赏 系统 ,使 得 个 体 更 倾向 于 去 寻求 奖赏 性 刺激 来 缓解 因 负 性 情绪 带 来 的 不 适 感 ， 同 时， 奖赏 
系统 将 以 往 的 奖赏 体验 (如 权力 感 和 满足 感 ) 传 递 给 情绪 系统 ， 以 此 引发 积极 的 情绪 体验 ， 这 
种 相互 促进 的 关系 为 个 体 做 出 惩罚 决策 提供 了 动力 。 
4.2 认 知 系统 内 部 关系 及 其 对 第 三 方 惩罚 行为 的 影响 
N 认 知 系统 包括 社会 认 知 系统 和 执行 控制 系统 。 在 TPP 中 ， 个 体 需要 根据 违规 行为 信息 
= 来 评估 伤害 程度 以 及 推断 违规 者 的 心理 状态 (Ginther et al., 2016; Treadway et al., 2014)， 而 默 
认 模 式 网 络 中 与 心智 化 相关 的 脑 区 如 TPJ 和 dmPFC 在 意图 推断 方面 起 着 重要 作用 (Feng et 
al., 2022)， 且 中 央 执 行 网 络 的 核心 脑 区 dlPFC 的 激活 体现 了 认 知 控制 在 TPP 中 的 重要 性 ( 舱 
西 乐 等 , 2019)。 因 此 ， 社 会 认 知 系统 和 执行 控制 系统 与 默认 模式 网 络 和 中 央 执 行 网 络 这 两 
个 脑 网 络 相 对 应 ， 分 别 参与 “责任 评估 ”和 “惩罚 选择 ”两 个 阶段 。 有 研究 者 指出 ， 不 同 于 
更 多 的 由 情绪 驱动 的 第 二 方 惩罚 ,TPP 者 更 着 重 于 对 违规 者 的 意图 推断 ， 其 重要 性 可 能 超过 
情绪 (Ginther et al., 2016; Treadway et al., 2014)， 这 体现 了 TPP 过 程 中 社会 认 知 系统 的 重要 作 
用 .另外 , 个 体 最 后 是 否 做 出 惩罚 行为 以 及 惩罚 的 强度 , 又 受到 执行 控制 系统 的 影响 。 因 此 ， 
会 认 知 系统 和 执行 控制 系统 对 TPP 行为 的 作用 是 递 进 式 的 ， 而 非 相互 独立 。 在 神经 层 
上 ，Buckholtz 等 人 (2008) 首 次 发 现 TPJ 和 dIPFC 的 活动 存在 “ 持 抗 ”关系 : 当 TPJ 活动 增 
加 时 ，dIPFC 表现 失 活 ， 而 当 个 体 决定 惩罚 时 ， 其 活跃 度 又 增加 ， 体 现 了 dlPFC 的 双 相 神经 
活动 ， 此 外 ，Zinchenko 等 人 (2021) 的 研究 也 发 现 ， 右 侧 dIPFC 和 右 侧 TPJ 之 间 的 整体 静 息 
状态 连接 与 TPP 水 平 负 相关 。 任 务 态 和 静 妃 态 的 研究 均 表明 ， 默 认 模式 网 络 (TPJ]) 和 中 央 执 
了 网 络 (dIPFC) 之 间 存 在 “ 持 抗 ”关系 (箭头 6)， 更 具体 地 说 ，dlPFC 的 这 种 双 相 神经 活动 可 
能 是 中 央 执 行 网 络 对 默认 模式 网 络 抑制 作用 的 基础 (Zinchenko & Klucharev, 2017)。 同 时 ， 两 
者 间 也 存在 互补 性 ( 陈 瀛 等 ,2020): 默认 模式 网 络 代表 “感性 ”的 社会 认 知 ， 反 映 了 由 认 知 
和 情绪 所 主导 的 责任 评估 ; 而 中 央 执 行 网 络 通常 代表 “理性 ”的 逻辑 思维 ， 在 认 知 控制 方 
的 作用 体现 了 大 脑 中 的 理性 思考 与 权衡 。“ 感 性 ”与 “理性 ”的 结合 体现 了 默认 模式 网 络 和 
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中 央 执 行 网 络 在 功能 上 的 互补 。 
4.3 自动 加 工 与 控制 加 工 通路 

结合 上 文 所 提 到 的 双 系 统 模型 ， 在 该 模型 中 存在 自动 加 工 和 控制 加 工 两 条 通路 (在 下 文 
称 通路 1 和 通路 2)。 两 条 通路 均 以 情绪 系统 作为 起 点 ， 由 执行 控制 系统 输出 最 终 
为 。 不 同 的 是 ， 个 体 观 察 到 违规 行为 后 (箭头 1 )， 通 路 1 中 情绪 系统 直接 将 整合 后 的 负 性 情 
绪 传递 给 认 知 系统 (箭头 2)， 由 执行 控制 系统 执行 惩罚 决定 ， 此 时 个 体 进行 惩罚 可 能 是 为 了 
消解 负 性 情绪 (箭头 和， 而 通路 2 中 加 入 了 大 脑 理性 控制 的 因素 ， 情 绪 系统 的 信息 先 由 社会 
认 知 系统 进行 伤害 程度 和 意图 的 评估 ， 再 由 执行 控制 系统 相关 脑 区 进行 情绪 和 自 利 的 权衡 
(箭头 3)， 最 终 执行 惩罚 决定 (箭头 4), 对 应 着 TPP “情绪 产生 ”“ 责 任 评估 ”和 “惩罚 选择 ” 
三 个 阶段 。 
4.4 奖赏 网 络 参 与 的 反馈 通路 

在 TPP 决策 过 程 中 ， 个 体 需要 时 刻 收 集 和 评估 环境 信息 ， 以 此 来 调整 行为 策略 ， 这 依 
赖 于 反馈 机 制 得 以 实现 。 具 体 来 说 ， 当 第 三 方 做 出 惩罚 决定 之 后 (箭头 4)， 负 性 情绪 的 消解 
以 及 权力 的 体验 感 和 满足 感 作为 相应 的 奖励 信号 正 反 馈 于 奖赏 系统 (箭头 7)， 为 下 一 次 惩罚 
提供 了 动力 。 根 据 RL 理论 ， 个 体 从 反馈 提供 的 奖励 信息 中 不 断 学 习 ， 综 合 考虑 各 项 因素 来 
预 估 奖 赏 的 最 大 值 ， 并 最 终 形 成 稳定 的 惩 避 模式 。 由 上 可 知 ， 反 馈 机 制 的 存在 使 TPP 行为 
的 发 生发 展 得 以 顺利 进行 ， 当 反馈 机 制 遭 到 破坏 ， 个 体 可 能 会 面临 异常 的 行为 ， 可 见 反馈 机 
制 在 TPP 认 知 神经 网 络 模型 中 起 着 关键 的 作用 。 
5 总 结 与 展望 

本 文 综述 了 近 十 年 来 的 TPP 相关 研究 ， 从 理论 模型 和 神经 网 络 两 个 层面 对 TPP 行为 的 
认 知 神经 机 制 进行 总 结 ， 并 在 前 人 研究 的 基础 上 提出 TPP 的 认 知 神经 网 络 模型 ， 从 更 加 宏 
观 的 角度 展现 了 TPP 行为 的 发 生发 展 过 程 和 神经 关联 。 在 该 模型 中 ， 情 绪 系统 和 奖赏 系统 
是 TPP 的 动力 来 源 ， 认 知 系统 主要 负责 责任 评估 以 及 惩罚 的 选择 ， 奖 赏 网 络 、 突 显 网 络 、 默 
认 模 式 网 络 和 中 央 执 行 网 络 分 别 参与 不 同 认 知 加 工 阶段 。 与 此 同时 ，TPP 行为 反馈 机 制 的 存 
在 使 得 个 体会 在 每 一 次 反馈 学 习 中 优化 行为 策略 ， 最 终 形 成 稳定 的 行为 模式 。 然 而 ， 目 前 对 
于 TPP 的 研究 还 存在 一 些 不 足 和 尚未 解决 的 问题 。 
5.1 神经 递 质 和 激素 对 第 三 方 惩罚 行为 的 影响 

认 知 神经 系统 受到 神经 递 质 和 激素 的 影响 (Hu, Scheele et al., 2016)。 探 究 TPP 行为 、 神 


经 递 质 、 激 素 三 者 间 的 关系 ， 有 助 于 我 们 从 更 微观 的 角度 理解 TPP 行为 。 本 文 仅 从 多 巴 胺 


的 TPP 行 


13 


水 平 及 其 遗传 变异 的 角度 对 个 体 惩 罚 行 为 背后 的 遗传 学 机 理 进 行 了 简单 放 析 ， 为 揭示 TPP 
行为 发 生 的 神经 生化 基础 提供 了 局 示 。 除 多 巴 胺 以 外 , 一 些 研 究 发 现 5- 凑 色 腕 水平 低 的 个 体 


表现 出 了 更 多 的 利他 惩罚 行为 (Emanuele et al., 2008)， 且 5-HTTLPR L/L 基因 携带 者 TPP 强 


度 更 大 (Enge etal.,2017)。 然 而 ，Enge 等 人 的 研究 并 未 排除 多 巴 胺 和 5- 产 色 胺 之 间 相 互 作用 
的 影响 ， 对 5- 羟色胺 如 何 影响 TPP 行为 的 机 制 也 尚 不 明确 。 在 激素 水 平 上 ， 已 有 研究 证 明 
肽 类 激素 催产 素 (oxytocin, OXT) 与 人 类 的 杀 社 会 行为 相关 (Marsh et al., 2021)。 然 而 目前 少 有 
究 探讨 外 源 性 OXT 与 TPP 行为 的 关系 。Krueger 等 人 (2012) 发 现 OXT 仅仅 影响 对 伤害 程 
度 的 感知 而 不 影响 TPP 的 强度 。 总 的 来 说 ， 目 前 对 神经 递 质 和 激素 及 其 基因 多 态 性 如 何 影 
响 TPP 行为 的 研究 尚 处 在 初步 阶段 ， 未 来 从 该 角度 入 手 有 助 于 从 更 微观 的 角度 揭示 TPP 行 
为 的 神经 生理 机 制 。 
52 第 三 方 惩罚 行为 的 个 体 差异 

以 往 的 研究 大 多 将 样本 进行 整体 性 的 分 析 ， 忽 略 了 个 体 之 间 的 差异 。 例 如 ， 共 情 作为 一 
种 理解 和 感受 他 人 情绪 的 能 力 ， 是 亲 社 会 行为 的 动机 来 源 之 一 ， 对 TPP 行为 有 着 重要 影响 
(Ferguson etal.,2019)， 个 体 在 面 对 更 加 贫穷 的 违规 者 时 共 情 水 平 更 高 ， 对 其 宽容 度 更 高 ， 因 
此 惩 避 强度 更 低 (Ouyang et al., 2021)。 然 而 ， 共 情 也 存在 着 巨大 的 个 体 差 异 ， 且 该 差异 可 能 
会 进一步 体现 在 神经 生理 反应 上 (van Baar et al., 2021; Wang et al., 2022)。 此 外 ， 由 于 传统 的 
ERP 分 析 对 所 有 的 被 试 数据 进行 了 组 平均 处 理 , 最 终 的 结果 可 能 无 法 反映 个 体 间 的 差异 , 导 
致 人 们 做 出 错误 的 解释 ( 陈 新 文 等 , 2023)。 因 此 ， 未 来 有 必要 将 个 体 差 异 如 共 情 、 社 会 价值 
取向 、 心 智 化 能 力 等 纳入 TPP 行为 的 认 知 神经 机 制 的 研究 ， 进 一 步 探讨 TPP 行为 的 神经 生 
理 表征 与 人 格 特质 变量 的 关系 。 
5.3 对 第 三 方 惩罚 行为 做 出 定量 的 解释 和 预测 

本 文 提出 的 TPP 的 认 知 神经 网 络 模型 能 够 在 一 定 程度 上 预测 TPP 行为 ， 但 尚 停留 在 定 
性 的 层面 ， 实 际 TPP 行为 的 产生 是 否 遵循 该 模式 还 需要 进一步 的 检验 。 近 年 来 ， 越 来 越 多 
的 研究 者 将 机 器 学 习 的 方法 应 用 到 认 知 加 工 领域 。 以 多 变量 解码 分 析 (multivariate decoding 
analysis) 为 例 ， 该 方法 可 以 量化 单个 神经 信号 所 代表 的 信息 ， 并 用 于 训练 和 测试 分 类 器 ， 将 
特定 事件 所 对 应 的 大 脑 活动 信号 进行 区 分 (Contini et al., 2017)。 这 里 的 神经 信号 可 以 来 自 神 


经 影像 学 信号 如 功能 磁 共 振 成 像 (functional magnetic resonance imaging, fMRI), taJ UK K 


Sr 
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神经 生理 学 信号 如 脑 电 图 (electroencephalogram，EEG) 和 脑 磁 图 (magnetoencephalogram， 
MEG)。 考 虑 到 TPP 是 一 个 由 多 个 子 阶段 组 成 的 复杂 社交 行为 ， 利 用 该 方法 可 以 进一步 探究 


与 TPP 行为 相关 的 复杂 神经 活动 模式 。 因 此 ， 未 来 需要 进一步 优化 和 发 展 相 关 模 型 ， 引 入 
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基于 机 器 学 习 分 析 方法 如 多 变量 解码 分 析 来 构建 数学 模型 , 探究 个 体 在 不 同情 况 下 如 不 同 惩 
罚 代 价 高 低 、 不 同 程度 的 不 公平 分 配方 案 等 的 神经 信号 差异 ， 以 此 对 TPP 行为 做 出 定量 的 
解释 和 预测 。 
5.4 第 三 方 惩罚 和 补偿 行为 认 知 神经 机 制 的 异同 
从 建立 声誉 的 角度 来 看 ， 第 三 方 个 体 对 违规 者 做 出 惩罚 表明 了 他 们 的 合作 意图 。 然 而 ， 
当 个 体 有 其 他 更 为 积极 的 方式 来 表达 自己 合作 倾向 的 时 候 , 这 种 通过 惩罚 而 建立 的 声誉 可 能 
是 有 害 的 (Raihani & Bshary, 2015a)。 具 体 来 讲 ， 当 第 三 方 个 体 不 仅 有 “惩罚 ”和 “不 作为 ” 
两 个 选项 ， 还 引入 了 “帮助 受害 者 ”这 一 条 件 时 ，TPP 的 利他 强度 会 减弱 ， 因 为 此 时 惩罚 会 
被 视 为 一 种 竞争 性 的 “损人 不 利己 ”的 信号 Jordan, Hoffman et al., 2016)， 而 帮助 会 得 到 更 
加 积极 的 评价 (Raihani & Bshary, 2015b; Li etal., 2018)。 在 这 种 复杂 的 社交 情境 下 ， 引 入 “第 
三 方 干预 ”就 显得 尤为 重要 ， 包 括 第 三 方 惩罚 和 第 三 方 补偿 (帮助 )。 与 惩罚 所 面 对 的 对 象 不 
H, 第 三 方 补偿 关注 的 焦点 在 受害 者 ， 即 第 三 方 个 体 牺牲 自己 的 利益 来 补偿 受害 者 ,使 其 真 
正 受益 。 已 有 研究 表明 ， 共 情 水 平 越 高 的 个 体 更 容易 做 出 帮助 他 人 的 决定 ， 且 帮助 和 惩罚 
后 的 神经 机 制 也 存在 异同 (Hu et al., 2015; Xie et al., 2022; MEH SF, 2019)。 由 于 这 两 种 干 
预 形式 所 关注 的 焦点 不 同 , 未 来 的 研究 可 以 关注 在 不 同 社交 情境 下 个 体 的 第 三 方 干预 偏好 及 
其 背后 的 神经 机 制 。 
5.5 利用 元 分 析 为 认 知 神经 网 络 模型 提供 统计 支撑 
本 文 提 出 的 认 知 神经 网 络 模型 能 够 在 理论 上 对 TPP 行为 的 发 生发 展 做 出 更 加 整体 、 全 
面 的 解释 ， 但 还 缺乏 一 定 的 统计 支撑 。 元 分 析 在 定性 分 析 的 基础 上 引入 了 定量 的 分 析 方法 ， 
PT 经 该 方法 得 出 的 结论 更 具有 概括 性 和 普遍 性 。 一 方面 ，TPP 的 产生 包括 不 同 的 阶段 ， 每 个 阶 
段 所 涉及 的 脑 区 和 网 络 激活 模式 也 各 不 相同 ， 利 用 元 分 析 能 够 处 理 分 析 大 量 的 单个 研究 数 
据 ， 做 到 有 效 的 综合 ( 董 奇 , 2004);， 另 一 方面 ， 前 人 在 探究 TPP 的 神经 心理 机 制 时 所 采用 的 
实验 范式 和 因 变 量 测量 方式 各 有 不 同 , 这 些 方法 上 的 变异 可 能 会 带 来 实验 结果 的 不 一 致 ， 而 
元 分 析 能 够 进一步 探索 研究 中 特征 变量 的 异 质 性 来 源 , 较 好 地 解决 这 一 问题 。 因 此， 未 来 在 
理论 模型 的 完善 过 程 中 , 可 以 利用 元 分 析 对 已 有 研究 结果 进行 综合 分 析 以 及 再 评价 , 为 模型 
提供 定量 的 数据 支撑 以 增加 模型 的 可 靠 性 。 
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The cognitive and neural mechanism of third-party punishment 


ZHENG Hao, CHEN Rongrong, MAI Xiaoqin 
(Department of Psychology, Renmin University of China, Beijing 100872, China) 


Abstract 

Third-party punishment (TPP) refers to the punitive behaviors that individuals impose on 
violators as third parties or observers in order to uphold social norms. Many studies have provided 
insight into the neural mechanisms underlying TPP behavior. However, few studies have focused 
on the overall role of functional brain networks. This paper reviews the researches related to TPP in 
the past decade and summarizes the relevant theoretical models and brain networks. Based on the 
previous studies, we propose a cognitive neural network model of TPP, which could systematically 
explain and integrate the neural mechanisms behind TPP behavior. In this model, the affective and 
reward systems are the TPP power sources, and the cognitive system is mainly responsible for 
responsibility assessment as well as punishment selection. The reward network, the salient network, 
the default mode network and the central executive network are involved in different cognitive 
processing stages, respectively. The model establishes the connection between TPP behavior-related 
research at the psychological and the cognitive-neural level and provides a more holistic and 
comprehensive explanation of the mechanisms of TPP behavior. In the future, it is necessary to use 
meta-analysis or machine learning algorisms in order to explore third-party intervention preferences 
and the underlying cognitive neural mechanisms in different contextual information and more 
complex social contexts. 
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2.2( 公 平 ， 不 公平 )x2( 单 
独 ， 他 人 在 场 ) 被 试 内 设计 


fMRI 


1. 阅 读 犯罪 故事 ， 判 断 其 应 
该 受到 的 惩罚 程度 
2. 四 个 部 分 分 开 呈 现 : 


呈现 顺序 平衡 ) 


=a 
Hh ee 


A: FRNA; B: 


描述 ，C: 伤害 程度 


D: 选择 惩罚 TW 
fMRI 


1. 第 三 方 惩罚 的 DG 任务 
2. 有 意 ( 独 裁 者 分 配 ) 和 无 意 


(计算 机 ) 分 配 条 件 


情绪 唤醒 / 认 知 过 程 


不 公平 分 配 下 ， 情 绪 唤 
醒 度 更 高 ， 愉 悦 感 更 
低 ; 他 人 的 存在 使 得 被 
试 责任 感 更 低 ， 其 评分 
可 以 显著 预测 惩罚 水 
平 ; 责任 扩散 下 ， 个 体 
以 为 别人 会 介入 (心智 
化 ) 


伤害 程度 评估 涉及 情感 
相关 大 脑 区 域 ; 意图 评 
估 和 伤害 程度 评估 是 两 
个 独立 的 过 程 


不 公平 厌 
图 评估 


a 


相关 脑 区 
/ERP 成 分 


AIC 
dmPFC 


mPFC 
dIPFC 
PBK 


ACC, 脑 咏 ， 
dIPFC, 
vmPFC, TPJ 


~ 散 减 少 了 第 三 方 


TY o 


意图 评估 涉及 默认 模式 
网 络 、 心 智 化 网 络 ， 伤 
害 程度 评估 涉及 情感 相 
KAKAK, WA 
核 。dlPFC 会 综合 以 上 
信息 做 出 最 后 的 惩罚 决 
定 。 


违规 行为 检测 、 意 图 评 
古 ， 主 观 价 值 表征 
的 神经 心理 机 制 。 


=> 


Glass et al. 
(2016) 


Bellucci et al. 
(2017) 


Wang et al. 
(2017) 


David et al. 
(2017) 


被 试 信息 


脑 损 伤 : 114 人 
M + SD = 63.36 + 
0.27 # 

对 照 组 : 32 人 
M+SD=63.41+4 
0.67 # 


26 名 健康 成 人 
(男性 13 名 ) 
M+SD=26.0+5.7 


bu 


vy 


26 名 学 生 

(男性 11 名 ) 

M + SD =20.92 + 
2.04 岁 


50 名 学 生 
(男性 23 名 ) 
M+SD =24.6 +3.5 


bu 


x 


实验 任务 


阅读 犯罪 故事 ， 判 断 其 应 
该 受到 的 惩罚 程度 


fMRI 
其 应 该 受到 的 惩罚 程度 


fMRI 
1. 第 三 方 惩罚 的 DG 任务 
2. 单 独 完成 /和 其 他 两 人 一 
起 完成 


fMRI 
1. 第 三 方 惩罚 /补偿 的 DG 
任务 

2. 关 注 违规 者 (OB)/ 关 注 受 
害 者 (VB)/ 对 照 组 


因 变 量 及 测量 


惩罚 程度 (0- 


选择 惩罚 /帮助 
的 比例 


情绪 唤醒 / 认 知 过 程 


评估 法 律 责任 、 确 定 适 
当 的 惩罚 两 种 认 知 机 秆 


=, 


负 性 情绪 越 强烈 ， 惩 罚 
程度 越 大 
评估 法 律 责 任 、 确 定 适 


Nn ee 
HET 


PERAR, iE 
度 越 大 (突显 网 络 ) 
心智 化 


ob 


EMT th Aas Al 


相关 脑 区 
/ERP 成 分 


mPFC 
dIPFC 


心智 化 网 络 
和 中 央 执 行 
网 络 


dACC 


TPJ 
dlPFC 


结论 


表现 为 非典 型 TPP 的 患 


1 


者 在 心智 化 (mPFC) 和 中 
央 执 行 网 络 (dIPFC) 的 核 


d 


Ex 


区 域 有 特定 的 病变 


o 


TPP 的 两 个 基本 认 知 功 


能 : 评估 法 律 责任 ， 确 


定 适 当 惩罚 ， 分 别 与 


智 化 网 络 和 中 央 执行 网 
络 相关 。 


d Ù 


被 试 对 不 公平 分 配 的 不 


公平 感 更 高 ， 情 绪 唤 醒 


度 更 高 ， 效 价 更 消极 ， 


jE F 
惩罚 更 大 ， 


dACC 活动 更 弱 。 
相 比 于 对 照 组 ， 当 被 试 


关注 的 焦点 在 违规 者 
Hy 


关注 的 焦点 在 受害 者 


O ETET; 


H 


在 单独 游戏 时 ， 责 任 


当 


寸 ， 倾 向 于 帮助 ，TPJ 


在 其 中 起 到 重要 作用 。 
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相关 脑 区 


研究 被 试 信 息 实验 任务 因 变 量 及 测量 情绪 唤醒 / 认 知 过 程 ees 结论 
MRI 
利他 惩罚 者 从 公平 规范 
1 利他 惩罚 者 (UG 中 拒绝 ， iron oan _ 
Yamagishiet 453 名 非 学 生 DG 中 和 您 罚 ) 和 恶意 惩罚 者 在 各 个 经 济 任 奖赏 尾 状 核 意 意 的 惩罚 者 从 看 到 目标 
al. (2017) 20-50 # (UG 中 拒绝 ，DG PAR = 务 中 的 表现 伏 隔 核 经 历 负面 后 果 中 获得 忆 
罚 ) Zeyh ~ 
Sed Ke 
2. 经 济 游戏 衡量 杀 社 会 偏好 
55 名 男性 fMRI pe? 7 
f : AS {FY 绪 和 Æ TPP HA 
aa = M+4SD=21.2424 1. 第 三 方 惩罚 的 正义 游戏 惩罚 /补偿 程度 ”情绪 与 惩罚 程度 相关 bp oe G 
B 2. 催 产 素 /安慰 剂 组 B 
脑 损伤 : 94 名 
M+SD=63.042.4 脑 损伤 研究 
Mollet al. 岁 1. 展 示 了 各 个 社会 组 织 及 其 , 双 侧 dmPFC 损伤 增加 了 
惩罚 /补偿 意图 的 表征 dmPFC 
(2018) 对 照 组 ，28 名 工作 Bal ee = 利他 惩罚 。 
MtSD=63.0+4.1 2. 判 断 是 否 惩罚 /奖励 /保留 
岁 
惩罚 程度 (0-9) 
ol MRI 对 犯罪 者 的 异 TPJ 操 犯罪 意图 好 ， 惩 罚 程 
Yang, Shao et MED aj ae 1. 阅 读 犯 罪 故 事 ， 判 断 其 应 ” 怒 、 厌 恶 、 同 ”厌恶 情绪 dlPFC 度 与 道德 可 接受 性 负 相 
al. (2019) a 0 该 受到 的 惩罚 程 度 情 程 度 评分 ; ”体验 心智 化 、 认 知 控制 dACC K, SRSA IE 
ied 2. 意 图 好 /意图 坏 道德 可 接受 性 脑 岛 


评分 
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BERSE 


(2019) 


Cui et al. 
(2019) 


Asp et al. 
(2019) 


Civai et al. 


(2019) 


被 试 信息 


90 名 大 学 生 
(41 名 男性 ) 
平均 年 龄 22 岁 


实验 一 : 60 名 大 
学 生 ( 男 性 27 名 ) 
M+SD=24.10+ 
2.33 B 

实验 二 : 27 名 大 
学 生 ( 男 性 14 名 ) 
M+SD=21.10+ 
2.83 岁 


26 名 vmPFC 损伤 
患者 


40 名 健康 成 人 
(7 名 男性 ) 
平均 年 龄 23.4 岁 


实验 任务 


tDCS 
1. 刺 激 脑 区 : dlPFC 

2. 第 三 方 惩罚 的 DG 任务 
有 成 本 惩 昼 和 无 成 本 惩罚 
两 种 条 件 


实验 一 

1. 第 三 方 惩罚 的 DG 游戏 
2.3( 不 公平 程度 )x3( 独 裁 者 
地 位 )x3( 接 受 者 地 位 ) 
实验 二 : ERP 

2. 第 三 方 惩罚 的 DG 游戏 
2.3( 不 公平 程度 )x3( 接 受 者 
地 位 ) 


脑 损伤 研究 

阅读 犯罪 故事 ， 判 断 其 应 
该 受到 的 惩罚 程度 
fMRI 

1. 第 三 方 惩罚 的 正义 游戏 
2. 被 试 观察 到 玩家 A MA B 
那里 拿 走 了 金币 ， 并 且 给 
B 留 下 的 更 少 ， 决 定 是 离 
开 / 惩 罚 A/ 补 偿 B 


惩罚 程度 (0-9) 


惩罚 /补偿 程度 


情绪 唤醒 / 认 知 过 程 


负 性 情绪 产生 惩罚 的 内 
在 冲动 
认 知 控制 ( 自 利 权衡 ) 


负 性 情绪 影响 TPP 行为 


相关 脑 区 
/ERP 成 分 


dlPFC 


MFN: 预期 
违背 
LPC: 认 知 
努力 


vmPFC 


AIC 
BL 


结论 


dlPFC 活动 影响 第 三 方 
的 负 性 情绪 反应 和 自 利 
加 工 过 程 。 


对 地 位 高 的 接受 者 提出 
的 不 公平 的 分 配 更 违反 
WLU, MEN 波幅 更 大 ， 
惩罚 程度 越 大 。 


vmPFC 损伤 的 个 体 对 情 


感 唤起 暴力 罪犯 分 配 了 
更 轻 的 惩罚 。 


社会 偏好 和 情感 体验 在 
TPP 中 的 作用 ， 以 及 不 
同 的 认 知 神经 机 制 。 
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Lo Gerfo et 
al. (2019) 


Zinchenko et 
al. (2019) 


Ouyang et al. 
(2021) 


Zinchenko et 
al. (2021) 


被 试 信息 


60 名 学 生 
(25 名 男性 ) 


M+SD = 23.0 +2.5 


Be 
实验 1: 


23 名 健康 成 人 


(7 名 男性 ) 


实验 2: 


21 名 健康 成 人 


(10 名 男性 ) 


29 名 大 学 生 
(男性 14 名 ) 


M+SD=22.0+ 


2.39 岁 


17 名 健康 成 人 


(男性 13 人 ) 


M+SD=214+43 


岁 


平均 年 龄 21.5 岁 


平均 年 龄 22.79 岁 


实验 任务 


tDCS 
1. 刺 激 脑 区 : TPJ、vmPFC 
2. 第 三 方 惩罚 的 DG 任务 


tDCS 

第 三 方 惩罚 的 DG 任务 
实验 1: 单独 刺激 TPJ 和 
dIPFC 

实验 2: 联合 刺激 TPS 和 
dIPFC 

ERP 

1. 第 三 方 惩罚 的 DG 任务 
2. 独 裁 者 为 穷人 (高 共 情 )/ 富 
人 ( 低 共 情 ) 

EEG 


第 三 方 惩罚 的 DG 任务 


惩罚 程度 


4 


vt Ae PE 


È 
= 


FM 及 测量 = 


a 振荡 


静 息 态 神经 元 


情绪 唤醒 / 认 知 过 程 
奖 沉 系统， 心智 化 
对 意图 推测 
共 情 


相关 脑 区 
/ERP 成 分 


vmPFC 
TPJ 


TPJ 


P200: 共 情 
MEN: 认 知 
冲突 
LPC: 
努力 


认 知 


TPJ 
dlPFC 


结论 


奖赏 系统 和 心智 化 系统 


是 利他 惩罚 的 基础 。 


上 


阳极 刺激 TPI 的 活动 可 


以 减少 惩罚 


个 体 更 倾向 于 惩 


TW 程度 。 


mA 


提出 来 的 高 度 不 公平 提 
议 ， 而 非 穷 人 ， 共 情 使 


个 体 更 愿 


接 与 TPP 
右 侧 TPJ 


意 容忍 违规 行 


右 侧 dIPFC 和 右 侧 TPI 
之 间 的 整体 静 息 状态 连 


强度 负 相 关 ; 
FARE ai 


BRAS 


的 个 体 表 3 


长 时 间 相 关 性 


岗 出 较 低 的 


TPP 水 平 。 
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相关 脑 区 


究 让 试 信 sis ARSE y= fea 、 to : 
研究 被 试 信息 实验 任务 因 变 量 及 测量 青 绪 唤 醒 / 认 知 过 程 ERE 成 分 结论 
享 廷 顿 病 患者 29 
名 (男性 20 名 ) 
M +SD =49.5 +8.9 
errr 30 个 体 作为 接受 FEDR BRA R VA 
ü | JG 任 者 在 UG 中 的 不 公平 的 感知 能 力 ， 但 
Briine et al. 名 (男性 20 名 ) 1.UG 任务 拒绝 率 ， 作 为 认 知 控制 、 奖 党 dIPFC 是 因为 不 良 的 执行 功能 
(2021) M + SD = 42.8 + 2. 第 三 方 惩罚 的 DG 任务 一 人 vs EATE f7 能 
10.3 岁 以 及 难以 体验 奖赏 导致 
对 照 组 30 名 (男性 中 的 惩罚 程度 TPP 行为 减少 。 
10 名 ) 
M+SD=42.8+ 
13.8 岁 
a i een 负 性 情绪 7 FRN: 预期 第 三 万 会 根据 成 员 的 经 
MEOD) espandida 2aRene. se. a EE 利和 维护 社会 规范 的 ”违背 济 水 平和 来 源 来 评估 其 
i ore ` 认 知 控制 P3: 注意 ”贡献 。 


岁 献 值 对 TPP 行为 影响 


刘 映 杰 等 
(2022) 


Xie et al. 
(2022) 


Cheng et al. 


(2022) 


被 试 信息 


实验 一 

31 名 大 学 生 
(男性 12 名 ) 

平均 年 龄 19.5 岁 
30 名 大 学 生 
(男性 15 名 ) 

平均 年 龄 20.37 岁 


60 名 大 学 生 
(男性 32 名 ) 
18-24 岁 


20 名 学 生 

(9 名 男性 ) 
M+SD=23.7+2.1 
岁 


实验 任务 


rTMS 


左 / 右 侧 vmPFC/ 假 刺激 
收益 /损失 情景 独裁 者 为 
接受 者 分 配 收益 /损失 (被 试 


内 ) 
实验 一 


实验 二 : 
第 三 方 惩罚 /补偿 
收益 /损失 情景 


fNIRS 


第 三 方 惩罚 的 DG 任务 


DG 任务 


1. 第 三 方 的 正义 游戏 


2. 优 势 /劣势 不 公 习 


fMRI 


经 验 


1. 第 三 方 惩罚 的 DG 任务 


2. 高 成 本 惩罚 (1:3) 和 低 成 本 


人 处 WWA: :6) 


因 变 量 及 测量 


惩罚 /补偿 / 保 


By 
Fal 


情绪 唤醒 / 认 知 过 程 


相关 脑 区 


/ERP 成 分 


负 性 情绪 是 引起 TPP 的 
关键 vmPFC 
负 性 情绪 、 高 不 公平 感 
dlPFC 

导致 更 严厉 的 惩罚 

AI, dIPFC: 
未 直接 测量 情绪 ， 但 不 ”不 公平 时 更 
公平 情况 下 的 AIC 活动 ”活跃 
增加 ( 负 性 情绪 表征 ) dACC: 高 成 
公平 和 自 利 机 制 的 权衡 ” 本 惩罚 情况 

下 更 活跃 


结论 


rTMS 抑制 右 侧 vmPFC 
的 功能 显著 降低 了 损失 
情境 下 的 第 三 方 惩罚 ， 
收益 情境 下 未 发 生 改 


在 经 历 不 利 不 公平 后 
被 试 的 负 性 情绪 更 强 ， 
不 公平 感 更 高 ， 更 倾向 
于 惩罚 而 非 补偿 。 


惩罚 决策 是 公平 偏好 和 
里 性 思考 (经 济 ) 综 合 考量 
的 结果 。 
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相关 脑 区 


研究 被 试 信息 实验 任务 因 变 量 及 测量 。。 情绪 唤醒 / 认 知 过 程 ERP 成 分 结论 
fMRI 
22 名 健康 成 : TPP 意图 和 结 
a secrete LFA DG EZ pose wo o A o 
a. ”6p _23 48 2 意图 和 结果 的 交互 作用 ， oe 意图 评估 的 重要 性 1 a e en 
DUAR REI FE cae dmPFC H ENA Az 
3.30 岁 意 、 企 图 、 有 意 到 重要 作用 。 


Iml 


1. 功 能 磁 共 振 成 像 (functional magnetic resonance imaging, fMRIT)， 重 复 经 颅 磁 刺激 (repeated transcranial magnetic stimulation, rTMS)， 经 颅 直流 电 刺 激 
(transcranial direct current stimulation, tDCS)， 脑 电 图 (electroencephalogram, EEG)， 功 能 性 近 红 外 光谱 技术 (functional near - infrared spectroscopy , fNIRS)， 
事件 相关 电位 (event-related potentials, ERP); 
. 背 侧 前 扣 带 皮层 (dorsal anterior cingulate cortex, d4ACC)， 前 脑 岛 皮层 (anterior insula cortex, AIC)， 查 仁 核 (Amygdala)， 背 内 侧 前 额 叶 皮层 (dorsomedial 
prefrontal cortex, dmPFC), sil JHE [X(temporoparietal junction, TPJ)， 背 外 侧 前 额 叶 皮层 (dorsomedial prefrontal cortex, dIPFC)， 腹 侧 纹 状 体 (ventral 
striatum, VS)， 腹 内 侧 前 额 叶 皮层 (ventromedial prefrontal cortex, vmPFC)， 内 侧 额 叶 负 波 (medial frontal negativity, MFN)， 晚 期 正成 分 (late positive 
component, LPC)， 反 馈 相 关 负 波 (feedback related negativity, FRN); 

3. 独 裁 者 博弈 (Dictator Game, DG), ip Ja HE ESE(Ultimatum Game, UG); 


hint 


4. 第 三 方 惩罚 的 正义 游戏 : 游戏 开始 时 ，Taker 和 Partner 都 有 相同 数量 的 金币 ，Taker 可 以 从 Partner 处 拿 走 金币 ， 也 可 以 维持 现 有 分 配 。 被 试 作为 第 三 六 


观察 Taker 和 Partner 进行 游戏 ， 在 Taker 做 出 决定 后 ， 第 三 方 可 以 花费 自己 的 金币 对 Taker BEAT RET « 
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